MatPL 可用参数
本节介绍了所有模型中可由用户定义的参数,可以分为基础参数和高级参数两类。基础参数需要用户指定,高级参数采用了默认值,用户可以在 json 文件中根据需求手动修改。在下面的参数中,"相对路径(relative path)" 表示相对于当前工作目录的路径,而 "绝对路径(absolute path)" 表示从根目录开始的文件或目录的完整路径。
基础参数
对于 MatPL 中的力场,只需要设置以下基础参数即可开始训练。
model_type
该参数用于指定用于训练的模型类型。您可以使用LINEAR
模型、NN
模型、DP
模型或 NEP
模型。
atom_type
该参数用于设置训练体系的元素类型。用户可以按照任意顺序指定元素的原子序数。例如,对于单元素系统如铜,可以设置为 [29],而对于多元素系统如 CH4,则可以设置为 [1, 6]。您也可以使用元素类型的名称,例如["Cu"] 或者 ["H", "C"]。
train_data
该参数用于指定训练集数据路径。您可以使用相对路径或绝对路径。
- 对于 DP 和 NEP 模型,支持的文件格式有
extxyz
、pwmlff/npy
、deepmd/npy
、deepmd/raw
、pwmat/movement
,vasp/outcar
,cp2k/md
- 对于 LINEAR 和 NN 模型,仅支持
pwmat/movement
格式
valid_data
该参数用于指定验证集数据路径。您可以使用相对路径或绝对路径。
- 对于 DP 和 NEP 模型,支持的文件格式有
extxyz
、pwmlff/npy
、deepmd/npy
、deepmd/raw
、pwmat/movement
,vasp/outcar
,cp2k/md
- 对于 LINEAR 和 NN 模型,仅支持
pwmat/movement
格式
test_data
该参数用于test
命令做推理时指定测试集数据路径。您可以使用相对路径或绝对路径。
- 对于 DP 和 NEP 模型,支持的文件格式有
extxyz
、pwmlff/npy
、deepmd/npy
、deepmd/raw
、pwmat/movement
,vasp/outcar
,cp2k/md
- 对于 LINEAR 和 NN 模型,仅支持
pwmat/movement
格式
format
该参数用于指定数据(train_data
、valid_data
、test_data
)的格式,支持的数据格式有扩展的xyz格式 extxyz
、pwmlff/npy
、deepmd/npy
、deepmd/raw
格式。此外也支持直接使用 PWmat, VASP, CP2K 轨迹文件, 对应 format
参数分别为 pwmat/movement
, vasp/outcar
, cp2k/md
。默认格式为 pwmat/movement
。细节请参考数据格式转换工具pwdata
。
注意,输入数据的格式需要一致。
model_load_file
该参数用于test
命令做推理时指定模型的路径,支持相对或者绝对路径。